人类肝脏疾病本体的构建及其应用

人类肝脏疾病本体的构建及其应用

作者:师大云端图书馆 时间:2015-06-05 分类:论文格式 喜欢:3296
师大云端图书馆

【摘要】本体是对特定领域知识概念化的明确而规范的说明,是描述该领域的概念以及概念间关系等知识的标准化术语系统,也被称为领域本体。在本体中,概念和概念之间的关系被逐一确立,并被赋予明确唯一的定义。本体的使用者运用这些规范化的概念和关系来描述该领域的相关事物和知识,减少了对相同涵义信息的表达异质性,从而实现信息的标准化描述,因此有利于各领域知识和信息在数据库及互联网中的存储与传播,加强了人机之间的理解和交流,是实现语义互联网的重要基础。与多数其它领域相比,生物医学信息学领域更充分地接受了本体思想,并发展和使用了更多的领域本体。本论文详尽而系统地介绍了生物医学领域中的一个新本体——人类肝脏疾病本体(HumanLiverDiseaseOntology,HuLDO)的构建过程、评估结果和应用举例,并简要介绍了另一个新本体——蛋白质相互作用本体(Protein-ProteinInteractionOntology,PPIO)的评估和应用过程。这些本体分别在肝脏疾病相关知识和分子相互作用信息的挖掘、整合、交流等方面具有着基础性的意义。人类肝脏疾病本体(HuLDO)是全面归纳人类各种肝脏疾病概念,并对其进行定义、分类和注释的术语系统,其所收录的疾病概念和术语来源于目前已有的疾病本体和经典术语集,以及国际和国内的肝脏病学领域权威著作。该本体目前共收录了227种肝脏疾病,对每种肝脏疾病均给出其定义、同义词、分类、描述说明等注释信息,还包含了部分疾病之间的多种病理学关系,每条记录的各个知识均经过人工确认并提供其参考来源信息。与已有相似本体和经典术语集相比:HuLDO具有最全面的肝脏疾病类型和最丰富的同义词等注释信息,为进一步的本体应用打下了坚实的基础。首先,根据HuLDO的疾病分类结构,我们构建了人类肝脏知识总库——LiverAtlas的疾病子库,并利用HuLDO进行了人类肝脏疾病相关基因/蛋白质信息的收集和整合。目前该库从16个已有数据库中整理和收录了与59种肝脏疾病相关的共18,243个遗传学生物分子事件,并对每条疾病与分子的关联性记录的可信度做出了参考评分。目前该库提供数据的浏览、查询、批量下载等功能,并与LiverAtlas的基因子库、蛋白质子库、通路子库等数据库之间建立了完善的数据关联。该数据库为肝脏疾病病理学分子水平的研究提供了丰富的参考信息。其次,为了不断扩充LiverAtlas疾病子库数据,我们利用HuLDO字典和多种生物分子名称实体识别方法,对文献中的肝脏疾病与基因/蛋白质分子间的关系进行了全面的挖掘。疾病与分子的关系挖掘重点在于疾病名称实体文本挖掘和分子名称实体文本挖掘两个环节,在前一环节中,我们深入地研究了基于HuLDO字典的文本挖掘的技术细节的优化;在后一环节中,我们利用人工构建的标准数据集,客观评估和比较了ABNER工具、GNAT工具,以及自行研发的生物分子名称识别方法的性能,并确定了综合性的优化挖掘策略,并对挖掘结果进行了可视化的展示。最后,结合HuLDO中所提示的疾病间的病理学关系和肝脏疾病数据库中所收集的各疾病相关分子,我们对“肝炎→肝硬化→肝癌”发展过程中的分子机制加以分析和推测,对三种肝病相关的和独有的基因进行了生物学过程、分子网络和通路、hub基因三方面的分析,并对分析结果逐一做出了生物学的解释,指出了潜在的新的疾病相关基因和生物学事件,为进一步实验研究提供了参考。蛋白质相互作用本体(PPIO)是基于事件概念模型构建的描述蛋白质相互作用所参与的生物过程、所在的亚细胞定位、所扮演的分子角色、所采用的作用方式、所实现的生物学功能和实验检测手段共六方面特征的本体,其概念和术语来源于GeneOntology(GO)等权威的相关本体和术语系统。通过与其近似的描述蛋白质相互作用信息的术语系统——PSI-MI的比较发现:PPIO包含较为丰富而全面的蛋白质相互作用相关术语集合,其知识覆盖领域与后者相比各自有所偏重,PPIO是描述蛋白质相互作用的生物学特征和信息的理想本体。通过基于PPIO字典的文本挖掘实验,证实了PPIO在蛋白质相互作用相关生物学知识的文本挖掘等方面具有良好的应用效果和重要的应用前景。随着本体研究在生物医学领域的不断发展和完善,各种生物医学相关本体必将在生物学相关知识自动挖掘、信息整理、信息整合、数据库构建等方面发挥重要的作用,为生物医学知识信息的高效而准确的沟通和传播提供有力的帮助。
【作者】杨春媛;
【导师】贺福初;
【作者基本信息】北京协和医学院,遗传学,2012,博士
【关键词】本体;领域本体;肝脏疾病;数据库构建;文本挖掘;蛋白质相互作用;

【参考文献】
[1]白晔.次乌头碱调控高迁移率族蛋白B1抗内皮细胞损伤[D].广州中医药大学,中西医结合基础,2014,博士.
[2]严燕超.卢梭自然状态理论的政治意蕴[D].扬州大学,思想政治教育,2012,硕士.
[3]石艳.南京明星轴承厂员工培训体系设计研究[D].西北大学,工商管理(专业学位),2012,硕士.
[4]韩晓敏.珍稀濒危南药沉香主要成分检测方法研究[D].燕山大学,化学工艺,2014,硕士.
[5]李权东.中文企业简介英译研究[D].上海外国语大学,翻译学,2013,硕士.
[6]吴文庆.船舶动力电力系统仿真训练服务器软件的设计与实现[D].大连海事大学,控制理论与控制工程,2013,硕士.
[7]吴丽萍.农村初中校本课程开发与实施探索[D].华中师范大学,教育管理,2014,硕士.
[8]裴佳乐.舟山群岛新区建设背景下嵊泗县旅游发展研究[D].宁波大学,政府管理(专业学位),2013,硕士.
[9]陈燕.脑源性神经营养因子基因多态性及单体型与多囊卵巢综合征的相关性研究[D].广州医科大学,妇产科学,2014,硕士.
[10]段卫明.RbAP46基因转染白血病细胞系的实验研究[D].苏州大学,内科血液学,2003,硕士.
[11]张琳.彩色扫描文档的自动分割和去网[D].西安理工大学,制浆造纸工程,2004,硕士.
[12]牟倩.基于系统动力学的云南鲜花产业库存控制模型研究[D].哈尔滨工业大学,企业管理,2014,硕士.
[13]吴晨.黄山市旅游景区空间结构分析及优化研究[D].安徽大学,旅游管理,2013,硕士.
[14]严娟.对外汉语教学中“有”字句教学初探[D].苏州大学,汉语国际教育(专业学位),2013,硕士.
[15]薛禹胜,任先成,韦化.关于低频低压切负荷决策优化协调的评述[J].电力系统自动化,2009,09:100-107.
[16]林伟.基于特征提取与GMM算法的大数据集配准方法研究[D].上海大学,基础数学,2013,硕士.
[17]张敏.高中生物课堂有效教学策略的实践及研究[D].苏州大学,教育(专业学位),2012,硕士.
[18]余方.中国英语学习者学位论文引言部分的语类分析:语步结构与评价策略[D].南京大学,英语语言文学,2013,硕士.
[19]孙娜.石墨烯纳米带电子拉伸调控[D].浙江师范大学,2012.
[20]林阳.基于.NET的银行信贷业务管理系统的设计与实现[D].吉林大学,软件工程,2014,硕士.
[21]赵亚男.奥巴马在复旦大学的演讲模拟口译实践报告[D].河北大学,英语口译,2014,硕士.
[22]卢俊阳.二尖瓣置换术同期手术治疗功能性三尖瓣反流的指征探索[D].兰州大学,心脏外科(专业学位),2013,硕士.
[23]刘江鹏.基于互补双环左手材料的微带天线设计与研究[D].华中科技大学,微电子学与固体电子学,2013,硕士.
[24]刘颖.北京市流动人口基本公共服务研究[D].吉林大学,社会医学与卫生事业管理,2013,硕士.
[25]吳昱昊.《史記會注考證校補》研究[D].南京师范大学,中國古典文獻學,2012,博士.
[26]严翔,王立德,杨宁,申萍.MVB-Ethernet网关设计与时延分析[J].北京交通大学学报,2014,02:106-111.
[27]彭志远.直接法合成三烷氧基硅烷的研究[D].湖南师范大学,有机化学,2004,硕士.
[28]闫旭.异甘草酸镁对原发性肝癌患者经导管肝动脉化疗栓塞术后肝功能的影响[D].河北医科大学,内科学(专业学位),2013,硕士.
[29]韩雪峰.手指口述工作法在潞安集团五阳煤矿安全生产工作中的应用研究[D].辽宁工程技术大学,安全管理工程,2012,硕士.
[30]王旭.越南阮朝宗庙制度研究[D].广西民族大学,专门史,2013,硕士.
[31]程广斌.应用于数字化诊断的若干医学图像分析方法研究[D].南方医科大学,2008.
[32]刘寅.石墨烯/碳纳米管/硅橡胶导电复合材料的研究[D].青岛科技大学,2011.
[33]彭丹丹.OFDM原理及其同步、信道估计和解映射算法研究[D].浙江大学,通信与信息系统,2004,硕士.
[34]刘子述.催化氧化—芬顿组合工艺处理重烷基苯磺酸盐生产废水的研究[D].哈尔滨工业大学,环境工程,2013,硕士.
[35]张钦,王锡凡,王建学.需求侧实时电价下供电商购售电风险决策[J].电力系统自动化,2010,03:22-27+43.
[36]彭相如.产业集群中的技术创新研究[D].江西财经大学,技术经济及管理,2004,硕士.
[37]姚立杰,程小可.国际财务报告准则研究的回顾和展望[J].会计研究,2011,06:25-31+95.
[38]王洋.影响上市公司企业价值的财务绩效研究[D].沈阳理工大学,会计学,2012,硕士.
[39]王晖,廖建新,曾志群,周俊峰.基于WIN的位置业务体系结构[J].现代电信科技.2005(04)
[40]许向阳,祝和云,孙优贤.鲁棒自适应控制器的一种设计方法[J].自动化学报,2000,01:83-88.
[41]王崇.基于云模型的B2B电子商务信任度评价方法研究[D].华中师范大学,管理科学与工程,2013,硕士.
[42]卜一.云南省农业巨灾保险市场政府介入时机与模式研究[D].云南财经大学,保险(专业学位),2014,硕士.
[43]茹艳青.中原经济区规划背景下的晋豫合作研究[D].山西财经大学,区域经济学,2014,硕士.
[44]李威辰,陈桂鹏,崔文峰,李武华,何湘宁.模块化光伏并网逆变器的线性功率控制[J].电工技术学报,2014,10:157-165.
[45]宋秀红.广义系统的约束预测控制研究[D].鲁东大学,运筹学与控制论,2013,硕士.
[46]李桂元.折射资料处理方法[J].石油地球物理勘探,1999,S1:103-108+114-150.
[47]李邓邓.全景图像拼接算法的研究与实现[D].浙江工业大学,2012.
[48]郭文文.基于UTAUT模型的微博用户使用行为影响因素研究[D].大连理工大学,企业管理,2013,硕士.
[49]吉训明.码头护岸边坡稳定分析方法探讨及应用[D].华南理工大学,建筑与土木工程,2014,硕士.
[50]梁银杏.关于我国放射性药品注册管理制度的研究[D].复旦大学,药剂学,2012,硕士.

相关推荐
更多